<html>
 <head>
  <meta charset="utf-8"/>
  <meta content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no" name="viewport"/>
  <title>
   主题：RQDA和文挖掘框架包tm结合进行文本挖掘  | 数螺 | NAUT IDEA
  </title>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap-theme.min.css" rel="stylesheet"/>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap.min.css" rel="stylesheet"/>
  <style type="text/css">
   #xmain img {
                  max-width: 100%;
                  display: block;
                  margin-top: 10px;
                  margin-bottom: 10px;
                }

                #xmain p {
                    line-height:150%;
                    font-size: 16px;
                    margin-top: 20px;
                }

                #xmain h2 {
                    font-size: 24px;
                }

                #xmain h3 {
                    font-size: 20px;
                }

                #xmain h4 {
                    font-size: 18px;
                }


                .header {
	           background-color: #0099ff;
	           color: #ffffff;
	           margin-bottom: 20px;
	        }

	        .header p {
                  margin: 0px;
                  padding: 10px 0;
                  display: inline-block;  
                  vertical-align: middle;
                  font-size: 16px;
               }

               .header a {
                 color: white;
               }

              .header img {
                 height: 25px;
              }
  </style>
  <script src="http://cdn.bootcss.com/jquery/3.0.0/jquery.min.js">
  </script>
  <script src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=TeX-AMS-MML_HTMLorMML" type="text/javascript">
   MathJax.Hub.Config({elements: ["bbpress-forums"]});
  </script>
  <script src="http://nautstatic-10007657.file.myqcloud.com/static/css/readability.min.js" type="text/javascript">
  </script>
  <script type="text/javascript">
   $(document).ready(function() {
                 var loc = document.location;
                 var uri = {
                  spec: "http://cos.name/cn/topic/102130/?new=1",
                  host: "http://cos.name",
                  prePath: "http://cos.name",
                  scheme: "http",
                  pathBase: "http://cos.name/"
                 };
    
                 var documentClone = document.cloneNode(true);
                 var article = new Readability(uri, documentClone).parse();
     
                 document.getElementById("xmain").innerHTML = article.content;
                });
  </script>
  <!-- 1466445350: Accept with keywords: (title(0.333333333333):和文,框架,主题,论坛,挖掘,文本, topn(0.133333333333):分类,帖子,作者,会员,分词,和文,人民网,异地,用词,第一桶金,编码,词条,文件,矩阵,公安部,问题,普通,搜房网,信贷,挖掘,链接,版主,框架,驾驶证,主题,交通,身份证,网友,文本,错号).-->
 </head>
 <body class="topic bbpress single single-topic postid-102130 single-author sidebar" onload="">
  <div class="header">
   <div class="container">
    <div class="row">
     <div class="col-xs-6 col-sm-6 text-left">
      <a href="/databee">
       <img src="http://nautidea-10007657.cos.myqcloud.com/logo_white.png"/>
      </a>
      <a href="/databee">
       <p>
        数螺
       </p>
      </a>
     </div>
     <div class="hidden-xs col-sm-6 text-right">
      <p>
       致力于数据科学的推广和知识传播
      </p>
     </div>
    </div>
   </div>
  </div>
  <div class="container text-center">
   <h1>
    主题：RQDA和文挖掘框架包tm结合进行文本挖掘
   </h1>
  </div>
  <div class="container" id="xmain">
   <div class="hfeed site" id="page">
    <header class="site-header" id="masthead" role="banner">
     <div id="cos-logo">
      <a href="http://cos.name/cn">
       <img src="http://cos.name/cn/wp-content/themes/COS-forest/images/headers/cos-logo.png"/>
      </a>
     </div>
     <div class="navbar" id="navbar">
      <nav class="navigation main-navigation" id="site-navigation" role="navigation">
       <h3 class="menu-toggle">
        菜单
       </h3>
       <div class="menu-%e8%8f%9c%e5%8d%951-container">
        <ul class="nav-menu" id="menu-%e8%8f%9c%e5%8d%951">
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-home menu-item-407772" id="menu-item-407772">
          <a href="http://cos.name/cn/">
           论坛首页
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-407773" id="menu-item-407773">
          <a href="http://cos.name/cn/forums/">
           讨论区
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-407774" id="menu-item-407774">
          <a href="http://cos.name/cn/wp-login.php?action=register">
           注册
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-407819" id="menu-item-407819">
          <a href="http://cos.name/">
           主站
          </a>
         </li>
        </ul>
       </div>
      </nav>
      <!-- #site-navigation -->
     </div>
     <!-- #navbar -->
    </header>
    <!-- #masthead -->
    <div class="site-main" id="main">
     <div class="content-area" id="primary">
      <div class="site-content" id="content" role="main">
       <article class="post-102130 topic type-topic status-publish hentry" id="post-102130">
        <header class="entry-header">
         <h1 class="entry-title">
          RQDA和文挖掘框架包tm结合进行文本挖掘
         </h1>
        </header>
        <!-- .entry-header -->
        <div class="entry-content">
         <div id="bbpress-forums">
          <div class="bbp-breadcrumb">
           <p>
            <a class="bbp-breadcrumb-home" href="http://cos.name/cn/">
             COS论坛 | 统计之都
            </a>
            <span class="bbp-breadcrumb-sep">
             ›
            </span>
            <a class="bbp-breadcrumb-root" href="http://cos.name/cn/forums/">
             讨论区
            </a>
            <span class="bbp-breadcrumb-sep">
             ›
            </span>
            <a class="bbp-breadcrumb-forum" href="http://cos.name/cn/forum/software/">
             软件应用
            </a>
            <span class="bbp-breadcrumb-sep">
             ›
            </span>
            <a class="bbp-breadcrumb-forum" href="http://cos.name/cn/forum/software/r-language/">
             S-Plus &amp; R语言
            </a>
            <span class="bbp-breadcrumb-sep">
             ›
            </span>
            <span class="bbp-breadcrumb-current">
             RQDA和文挖掘框架包tm结合进行文本挖掘
            </span>
           </p>
          </div>
          <div class="bbp-template-notice info">
           <p class="bbp-topic-description">
            该主题包含 25 条回复，13个帖子，最后由
            <a class="bbp-author-avatar" href="http://cos.name/cn/profile/384193/" rel="nofollow" title="查看hwssg的档案">
             <img src="http://sdn.geekzu.org/avatar/390e3a5ab26a7bf3e413a0b24da549ca?s=14&amp;d=monsterid&amp;r=g"/>
            </a>
            <a class="bbp-author-name" href="http://cos.name/cn/profile/384193/" rel="nofollow" title="查看hwssg的档案">
             hwssg
            </a>
            在
            <a href="http://cos.name/cn/topic/102130/page/2/#post-395759" title="回复：RQDA和文挖掘框架包tm结合进行文本挖掘">
             2 年, 3 月 之前
            </a>
            更新。
           </p>
          </div>
          <div class="bbp-pagination">
           <div class="bbp-pagination-count">
            查看 15 个帖子 - 1 到 15（总计 26 个）
           </div>
           <div class="bbp-pagination-links">
            <span class="page-numbers current">
             1
            </span>
            <a class="page-numbers" href="http://cos.name/cn/topic/102130/page/2/?new=1">
             2
            </a>
            <a class="next page-numbers" href="http://cos.name/cn/topic/102130/page/2/?new=1">
             →
            </a>
           </div>
          </div>
          <ul class="forums bbp-replies" id="topic-102130-replies">
           <li class="bbp-header">
            <div class="bbp-reply-author">
             作者
            </div>
            <!-- .bbp-reply-author -->
            <div class="bbp-reply-content">
             帖子
            </div>
            <!-- .bbp-reply-content -->
           </li>
           <!-- .bbp-header -->
           <li class="bbp-body">
            <div class="bbp-reply-header" id="post-102130">
             <div class="bbp-meta">
              <span class="bbp-reply-post-date">
               2010年7月19日 上午12:45
              </span>
              <a class="bbp-reply-permalink" href="http://cos.name/cn/topic/102130/#post-102130">
               1 楼
              </a>
              <span class="bbp-admin-links">
              </span>
             </div>
             <!-- .bbp-meta -->
            </div>
            <!-- #post-102130 -->
            <div class="odd bbp-parent-forum-999 bbp-parent-topic-102130 bbp-reply-position-1 user-id-102633 topic-author post-102130 topic type-topic status-publish hentry">
             <div class="bbp-reply-author">
              <a class="bbp-author-avatar" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               <img src="http://sdn.geekzu.org/avatar/f9b2e1cc05c328fef6b12bbb5c11caa9?s=80&amp;d=monsterid&amp;r=g"/>
              </a>
              <br/>
              <a class="bbp-author-name" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               bensonwu
              </a>
              <br/>
              <div class="bbp-author-role">
               普通会员
              </div>
             </div>
             <!-- .bbp-reply-author -->
             <div class="bbp-reply-content">
              <p>
               应用定性数据分析包RQDA(Qualitative Data Analysis)和文挖掘框架包tm结合进行文本挖掘。
              </p>
              <p>
               在对访谈内容或剧本、小说部分内容进行文本挖掘时，如果用不断的剪粘保存的方法非常繁琐而且容易漏掉一些内容。好在黄荣贵开发的RQDA包可以进行文档管理和内容编码及提取，大大方便了利用tm包进行文本挖掘，既提高了效率又提高了准确性，下面举一个小例子：
              </p>
              <p>
               1、安装RQDA包、tm包和中文分词软件（分词软件见下面链接）；
               <br/>
               <a class="d4pbbc-url" href="http://www.pinggu.org/bbs/thread-853290-1-1.html" rel="nofollow" target="_blank">
                http://www.pinggu.org/bbs/thread-853290-1-1.html
               </a>
               <br/>
               2、装载RQDA包并建立一个新的工程项目；
              </p>
              <p>
               3、输入相关文本文件；
              </p>
              <p>
               4、进行编码和作标记；
              </p>
              <p>
               5、双击想要提取的编码即可提取相关文本；
              </p>
              <p>
               6、运行下面下载的程序进行文本提取、转换、分词、文本挖掘工作。
              </p>
              <pre class="highlight ">&gt; gg &lt;- RQDA2tm("记者" ,mf = FALSE)
&gt; gg
A corpus with 55 text documents
&gt;
------------------------------------------------
&gt; ###  去掉多余空格  ####
&gt; reuters &lt;- tm_map(gg, stripWhitespace)
&gt; reuters[[1]]
这个也是临时改的？这儿应该放一个那样的桌子。
&gt;
------------------------------------------------
&gt; ##  全文搜索   ##
&gt; searchFullText(gg[[1]], "是临[时]?改")
[1] TRUE
&gt;
------------------------------------------------
&gt; ###  查找以某字开头、结尾等的词条  ###
&gt; stemCompletion(gg, c("财", "政", "部"))
                  财                        政                       部
"财政部就是替政府花钱的"                       ""                       ""
------------------------------------------------
&gt; ###  元数据管理  ###
&gt; DublinCore(reuters[[2]], "title") &lt;- "建国60周年"
&gt; meta(reuters[[2]])
Available meta data pairs are:
  Author       :
  DateTimeStamp: 2010-07-15 02:06:27
  Description  :
  Heading      : 建国60周年
  ID           : 2
  Language     : eng
  Origin       :
&gt;
------------------------------------------------
&gt; ###  创建词条-文件矩阵
&gt;
&gt; dtm &lt;- DocumentTermMatrix(reuters,control = list(minWordLength=2))##最短词两个字
&gt; inspect(dtm[1:2, 3:6])
A document-term matrix (2 documents, 4 terms)
Non-/sparse entries: 0/8
Sparsity           : 100%
Maximal term length: 5
Weighting          : term frequency (tf)
    Terms
Docs 10000 12 120 1966
   1     0  0   0    0
   2     0  0   0    0
------------------------------------------------
&gt; ##  操作词条-文件矩阵  ##
&gt; ##  1、找出最少出现过3次的词条  ##
&gt; findFreqTerms(dtm, 3)
[1] "政策"
------------------------------------------------
&gt; ##  2、找出与"应该"相关度到少达0.6的词条  ###
&gt; findAssocs(dtm, "应该", 0.6)
0.11 应该 桌子 临时
1.0  1.0  1.0  0.7
&gt;</pre>
              <p>
               其他看上面的链接中的内容，其实生成词条-文件矩阵后还有许多工作可以做，比如用支持向量机进行文件分类、话题分类、根据话题用词频率分析作者所熟悉的行业等等……
              </p>
              <p>
               民网 &gt;&gt; 时政 &gt;&gt; 时政专题 &gt;&gt; 网友进言
              </p>
              <p>
               <a class="d4pbbc-url" href="http://politics.people.com.cn/GB/8198/138817/index.html" rel="nofollow" target="_blank">
                http://politics.people.com.cn/GB/8198/138817/index.html
               </a>
              </p>
              <p>
               MetaID                                                         fname fid
               <br/>
               1      0                 公安部答复本网网友关于轻微交通违法处罚等4问题   1
               <br/>
               2      0 公安部答复本网网友关于驾龄计算、异地购车上牌、老人驾车等8问题   2
               <br/>
               3      0                 公安部答复本网网友关于如何转回农业户口等3问题   3
               <br/>
               4      0                 公安部回复本网网友关于驾驶证年检被注销等3问题   4
               <br/>
               5      0                 公安部回复人民网网友关于异地缴交通罚款等4问题   5
               <br/>
               6      0                 公安部回复人民网网友关于身份证重号错号等4问题   6
              </p>
              <p>
               一、出现5次以上的词条
               <br/>
               —————————————————————————-
               <br/>
               1、根据编码“网友”分析：
              </p>
              <pre class="highlight ">gg &lt;- RQDA2tm("网友" ,mf = TRUE)
&gt; findFreqTerms(dtm, 5)
[1] "驾驶"   "身份证" "问题"  </pre>
              <p>
              </p>
              <p>
               —————————————————————————-
               <br/>
               2、根据编码“公安部回应”分析：
              </p>
              <pre class="highlight ">gg &lt;- RQDA2tm("公安部回应" ,mf = TRUE)
&gt; findFreqTerms(dtm, 5)
[1] "办理"   "部门"   "公安"   "管理"   "规定"   "机动车" "机关"   "交通"
[9] "安全"   "不得"   "车辆"   "道路"   "驾驶"   "驾驶证" "汽车"   "实施"
[17] "使用"   "小型"   "营运"   "载货"   "载客"   "证明"   "工作"   "法律"
[25] "公民"   "居民"   "社会"   "身份"   "身份证" "条件"   "相关"   "行为"
[33] "证件"   "措施"   "违法"   "应当"   "公安部" "信息"  </pre>
              <p>
              </p>
              <p>
               **************************************************************
               <br/>
               二、找出与“驾驶”相关达70%以上的词条
               <br/>
               —————————————————————————-
               <br/>
               1、根据编码“网友”分析：
              </p>
              <pre class="highlight ">&gt; findAssocs(dtm, "驾驶", 0.7)
  驾驶 公安部   能否   规定   驾照   汽车
  1.00   0.87   0.80   0.79   0.78   0.72</pre>
              <p>
               —————————————————————————-
               <br/>
               2、根据编码“公安部回应”分析：
              </p>
              <p>
              </p>
              <pre class="highlight ">&gt; findAssocs(dtm, "驾驶", 0.7)
  驾驶   需要   期限   证明   小型   法律   使用   中型 驾驶证   依法   检查
  1.00   0.95   0.90   0.86   0.84   0.83   0.80   0.79   0.77   0.77   0.75
  有效   超过
  0.75   0.72</pre>
              <p>
               **************************************************************
               <br/>
               MetaID                                                         fname fid
               <br/>
               1      0                 公安部答复本网网友关于轻微交通违法处罚等4问题   1
               <br/>
               2      0 公安部答复本网网友关于驾龄计算、异地购车上牌、老人驾车等8问题   2
               <br/>
               3      0                 公安部答复本网网友关于如何转回农业户口等3问题   3
               <br/>
               4      0                 公安部回复本网网友关于驾驶证年检被注销等3问题   4
               <br/>
               5      0                 公安部回复人民网网友关于异地缴交通罚款等4问题   5
               <br/>
               6      0                 公安部回复人民网网友关于身份证重号错号等4问题   6
              </p>
              <p>
               对上面的数据改为将每条回应为研究对象进行文档聚类分析，结果如下：
              </p>
              <p>
               综合上面两种聚类分析可以判断：公安部负责对人民网网民进行回应的工作人员有两名，因为每个人的写作用词习惯是比较固定的。
              </p>
             </div>
             <!-- .bbp-reply-content -->
            </div>
            <!-- .reply -->
            <div class="bbp-reply-header" id="post-306351">
             <div class="bbp-meta">
              <span class="bbp-reply-post-date">
               2010年7月19日 上午12:58
              </span>
              <a class="bbp-reply-permalink" href="http://cos.name/cn/topic/102130/#post-306351">
               2 楼
              </a>
              <span class="bbp-admin-links">
              </span>
             </div>
             <!-- .bbp-meta -->
            </div>
            <!-- #post-306351 -->
            <div class="even bbp-parent-forum-999 bbp-parent-topic-102130 bbp-reply-position-2 user-id-102633 topic-author post-306351 reply type-reply status-publish hentry">
             <div class="bbp-reply-author">
              <a class="bbp-author-avatar" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               <img src="http://sdn.geekzu.org/avatar/f9b2e1cc05c328fef6b12bbb5c11caa9?s=80&amp;d=monsterid&amp;r=g"/>
              </a>
              <br/>
              <a class="bbp-author-name" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               bensonwu
              </a>
              <br/>
              <div class="bbp-author-role">
               普通会员
              </div>
             </div>
             <!-- .bbp-reply-author -->
             <div class="bbp-reply-content">
              <p>
               因为不会这里的插入图片和附件方法，所以没有相关附件，抱歉。
              </p>
             </div>
             <!-- .bbp-reply-content -->
            </div>
            <!-- .reply -->
            <div class="bbp-reply-header" id="post-306456">
             <div class="bbp-meta">
              <span class="bbp-reply-post-date">
               2010年7月23日 上午7:09
              </span>
              <a class="bbp-reply-permalink" href="http://cos.name/cn/topic/102130/#post-306456">
               3 楼
              </a>
              <span class="bbp-admin-links">
              </span>
             </div>
             <!-- .bbp-meta -->
            </div>
            <!-- #post-306456 -->
            <div class="odd bbp-parent-forum-999 bbp-parent-topic-102130 bbp-reply-position-3 user-id-102633 topic-author post-306456 reply type-reply status-publish hentry">
             <div class="bbp-reply-author">
              <a class="bbp-author-avatar" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               <img src="http://sdn.geekzu.org/avatar/f9b2e1cc05c328fef6b12bbb5c11caa9?s=80&amp;d=monsterid&amp;r=g"/>
              </a>
              <br/>
              <a class="bbp-author-name" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               bensonwu
              </a>
              <br/>
              <div class="bbp-author-role">
               普通会员
              </div>
             </div>
             <!-- .bbp-reply-author -->
             <div class="bbp-reply-content">
              <p>
               对三位房地产大佬在搜房网博客近期文章的分析：
              </p>
              <p>
               搜房网博客链接：
               <br/>
               潘石屹
               <br/>
               <a class="d4pbbc-url" href="http://blog.soufun.com/blog_132261.htm" rel="nofollow" target="_blank">
                http://blog.soufun.com/blog_132261.htm
               </a>
               <br/>
               王石
               <br/>
               <a class="d4pbbc-url" href="http://blog.soufun.com/blog_1525150.htm" rel="nofollow" target="_blank">
                http://blog.soufun.com/blog_1525150.htm
               </a>
               <br/>
               任志强
               <br/>
               <a class="d4pbbc-url" href="http://blog.soufun.com/blog_1796106.htm" rel="nofollow" target="_blank">
                http://blog.soufun.com/blog_1796106.htm
               </a>
              </p>
              <p>
               标题：
              </p>
              <pre class="highlight ">&gt; txt
  MetaID                          fname fid ID
1      0  穿越“鬼门关”登山者视界4(王)   3  1
2      0       美丽的建筑网友交流42(王)   7  2
3      0 如何了解日本民族网上交流43(王)   8  3
&gt; txt
  MetaID                            fname fid ID
1      0   从发改委的文件看政策的变化(任)   4  1
2      0                   该不该降价(任)   6  2
3      0                 听老柳侃管理(任)  11  3
4      0 稳定、明确的政策预期更为重要(任)  12  4
5      0   先拆还是先建，这是一门艺术(任)  13  5
6      0   幸福指数——再次写给八零后(任)  16  6
&gt; txt
   MetaID                                                 fname fid ID
1       0                      IPAD现象预示了社会结构的变化(潘)   1  1
2       0                              SOHO中国进驻上海外滩(潘)   2  2
3       0                        房地产业要做受人尊重的行业(潘)   5  3
4       0                商业地产与住房是两个完全不同的市场(潘)   9  4
5       0                              世界正经历分娩之阵痛(潘)  10  5
6       0                现在中国房地产市场上“尖叫”声一片(潘)  14  6
7       0                                信仰改变了我的生命(潘)  15  7
8       0               银河SOHO和光华路SOHO2通过LEED预认证(潘)  17  8
9       0                     银河SOHO开盘三天销售46.75亿元(潘)  18  9
10      0 致《酥油》作者： 你的爱和我们的感受构成世界的力量(潘)  19 10
&gt; </pre>
              <p>
              </p>
              <p>
               结果：
              </p>
              <pre class="highlight ">&gt; ##  任志强最喜欢的用词：
&gt; inspect(dtm_rzq[,j])
A document-term matrix (6 documents, 10 terms)
Non-/sparse entries: 41/19
Sparsity           : 32%
Maximal term length: 2
Weighting          : term frequency (tf)
    Terms
Docs 价格 企业 租赁 发展 改革 没有 社会 一代 知道 中国
   1    0    1    5    4    7    0    3    0    0    6
   2   31    2    0    3    1    7    4    0    4   15
   3    0   42    0    4    0    5    4    0    0    2
   4    9    1    0    0    0    7    4    0    3    4
   5    1    0   25    3    0    6    4    0    2    4
   6    1    5    0   25   48   30   55   41   35   51
&gt; ##  潘石屹最喜欢的用词：
&gt; inspect(dtm_psy[,j])
A document-term matrix (10 documents, 9 terms)
Non-/sparse entries: 49/41
Sparsity           : 46%
Maximal term length: 4
Weighting          : term frequency (tf)
    Terms
Docs 一个 商业 上海 外滩 项目 房地产 市场 土地 soho
  1    17   12    0    0    0      4    4    1    1
  2     6   17   15   27   21      1    2    2    6
  3     8    0    0    0    2     11    2   10    0
  4     6   16    0    0    2      0    5    0   13
  5    10    2    0    0    6      0    0    0    9
  6     5    4    3    0    1     17   37   15    0
  7     5    0    0    0    1      0    1    0    0
  8     1    0    0    0    8      0    0    0    7
  9     1   15    0    0    4      0    9    0   18
  10    7    0    0    0    0      0    0    1    0
&gt; ##  王石最喜欢的用词
&gt; inspect(dtm_ws[,j])
A document-term matrix (3 documents, 16 terms)
Non-/sparse entries: 17/31
Sparsity           : 65%
Maximal term length: 2
Weighting          : term frequency (tf)
    Terms
Docs 冰川 穿越 攀登 融化 珠峰 处理 东京 焚烧 垃圾 等级 了解 日本 喜欢 相扑
   1   18    6    4    8    4    0    0    0    0    0    0    0    0    0
   2    0    0    0    0    0    4    4    8   11    0    0    1    0    0
   3    0    0    0    0    0    0    0    0    0    4    4    7    4   10
    Terms
Docs 运动 秩序
   1    0    0
   2    0    0
   3    4    6</pre>
              <p>
              </p>
              <p>
               由此看来王石仍然在到处玩儿，怪不得从万科A到万科B，再到万科债券08G1、08G2都跌的一塌糊涂。
               <br/>
               任志强的兴趣仍在研究国家政策，忧国忧民啊！
               <br/>
               老潘的工作重点已经转到上海的商业地产了。
              </p>
             </div>
             <!-- .bbp-reply-content -->
            </div>
            <!-- .reply -->
            <div class="bbp-reply-header" id="post-306486">
             <div class="bbp-meta">
              <span class="bbp-reply-post-date">
               2010年7月25日 上午7:45
              </span>
              <a class="bbp-reply-permalink" href="http://cos.name/cn/topic/102130/#post-306486">
               4 楼
              </a>
              <span class="bbp-admin-links">
              </span>
             </div>
             <!-- .bbp-meta -->
            </div>
            <!-- #post-306486 -->
            <div class="even bbp-parent-forum-999 bbp-parent-topic-102130 bbp-reply-position-4 user-id-102633 topic-author post-306486 reply type-reply status-publish hentry">
             <div class="bbp-reply-author">
              <a class="bbp-author-avatar" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               <img src="http://sdn.geekzu.org/avatar/f9b2e1cc05c328fef6b12bbb5c11caa9?s=80&amp;d=monsterid&amp;r=g"/>
              </a>
              <br/>
              <a class="bbp-author-name" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               bensonwu
              </a>
              <br/>
              <div class="bbp-author-role">
               普通会员
              </div>
             </div>
             <!-- .bbp-reply-author -->
             <div class="bbp-reply-content">
              <p>
               好吧，现在再用支持向量机的方法对上面的数据建模，看是否能分辨出某些话是谁说的：
              </p>
              <p>
              </p>
              <pre class="highlight ">&gt; library(e1071)
&gt; ##  生成训练用的数据   ##
………………
&gt; tt &lt;- rbind(tt,tt1)
&gt;
&gt; tt[is.na(tt)]&lt;-0
&gt; tt[,"作者"] &lt;- factor(tt[,"作者"])
&gt; model &lt;- svm(作者 ~ ., data = tt[c(1:4,7:14,17:18),], kernel = "sigmoid")
&gt; summary(model)
Call:
svm(formula = 作者 ~ ., data = tt[c(1:4, 7:14, 17:18), ], kernel = "sigmoid")
Parameters:
   SVM-Type:  C-classification
SVM-Kernel:  sigmoid
       cost:  1
      gamma:  0.01666667
     coef.0:  0
Number of Support Vectors:  10
( 4 4 2 )
Number of Classes:  3
Levels:
潘石屹 任志强 王石
&gt; ##   模型拟合测试  ##
&gt; ##  训练集（样本内）拟合     ##
&gt; pred &lt;- predict(model, tt[c(1:4,7:14,17:18),1:length(hh)])
&gt; table(pred, tt[c(1:4,7:14,17:18),"作者"])
pred     潘石屹 任志强 王石
  潘石屹      7      0    0
  任志强      1      4    0
  王石        0      0    2
&gt; ##  测试集（样本外）预测     ##
&gt; pred &lt;- predict(model, tt[c(5:6,15:16,19),1:length(hh)])
&gt; table(pred, tt[c(5:6,15:16,19),"作者"])
pred     潘石屹 任志强 王石
  潘石屹      2      0    0
  任志强      0      2    0
  王石        0      0    1</pre>
              <p>
              </p>
              <p>
               训练集中有一个错的，但预测集中全中。
               <br/>
               *******************************************************
               <br/>
               哪么随机找两段他们的话看能判断出吗？
              </p>
              <pre class="highlight ">&gt;
&gt; test &lt;- c("昨天休息了一天，驻地村子现在很大，二年前很小，自首位成功登上珠穆朗玛峰的探险家埃德蒙.希拉里组织义工建立学校医疗诊所，当地条件开始显著改善，目前这里三分之一的当地人已经移民国外，境外一些人士建立了一些家庭小旅馆，卫生条件不错，新西兰狮子会建立了一家小卫生所，以改善当地的医疗条件。这些让我体会到登山这项运动对当地生活条件改善的有益影响。")
&gt;
………………
&gt; tt1[,c(test_h)] &lt;- test_tt[,c(test_h)]
&gt; tt1[is.na(tt1)]&lt;-0
&gt; predict(model, tt1)
   1
王石
Levels: 潘石屹 任志强 王石
&gt;</pre>
              <p>
               对了，是《珠峰零公里口述之四 (2010-4-9 16:06:22)》中的一段话。
               <br/>
               ++++++++++++++++++++++++++++++++++++++++
              </p>
              <pre class="highlight ">&gt; test &lt;- c("2007年出台的“第二套住房的信贷”新政，让中国的房地产市场调头直下，在“两防”的政策推力和美国的金融危机双重作用之下，让中国的宏观经济也随之调头直下，GDP快速下降到6.3%，从而让中国政府不得不用四万亿元投资、放量的货币信贷和解封“第二套住房信贷”改为0.7倍信贷降息和对改善性住房（实际的第二套）信贷给以支持，才让中国的房地产和宏观经济从谷底翻转恢复到保八之上。
+ ")
……………………
&gt; tt1[,c(test_h)] &lt;- test_tt[,c(test_h)]
&gt; tt1[is.na(tt1)]&lt;-0
&gt; predict(model, tt1)
     1
任志强
Levels: 潘石屹 任志强 王石
&gt;</pre>
              <p>
               也对了，是《何需分清几套房 (2010-4-29 9:38:52) 》中的一段话
              </p>
             </div>
             <!-- .bbp-reply-content -->
            </div>
            <!-- .reply -->
            <div class="bbp-reply-header" id="post-306520">
             <div class="bbp-meta">
              <span class="bbp-reply-post-date">
               2010年7月27日 上午2:16
              </span>
              <a class="bbp-reply-permalink" href="http://cos.name/cn/topic/102130/#post-306520">
               5 楼
              </a>
              <span class="bbp-admin-links">
              </span>
             </div>
             <!-- .bbp-meta -->
            </div>
            <!-- #post-306520 -->
            <div class="odd bbp-parent-forum-999 bbp-parent-topic-102130 bbp-reply-position-5 user-id-102633 topic-author post-306520 reply type-reply status-publish hentry">
             <div class="bbp-reply-author">
              <a class="bbp-author-avatar" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               <img src="http://sdn.geekzu.org/avatar/f9b2e1cc05c328fef6b12bbb5c11caa9?s=80&amp;d=monsterid&amp;r=g"/>
              </a>
              <br/>
              <a class="bbp-author-name" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               bensonwu
              </a>
              <br/>
              <div class="bbp-author-role">
               普通会员
              </div>
             </div>
             <!-- .bbp-reply-author -->
             <div class="bbp-reply-content">
              <p>
               那么下面这段文字是谁写的呢？
              </p>
              <p>
              </p>
              <pre class="highlight ">test &lt;- c("经常有人问我第一桶金怎么来的，从哪里得到的，有多少。其实每次有人问我这个问题时，我都想说，人的第一桶金是自信。即使你没钱也不要怕，自信就是你的资本。也有人在自信前面加了一个不好的修饰语，叫盲目自信，我不太爱听。我说过很多次自我的害处，但我认为与自我有点关系的不多的好东西之一，就是自信。自信当然有自我意识，还有信，相信的信。相信，是正面的、健康的。要相信自己。一个相信自己的人才会相信他人，相信未来。")
&gt; predict(model, tt1)
     1
潘石屹
Levels: 潘石屹 任志强 王石</pre>
              <p>
              </p>
              <p>
               太神奇了！潘石屹——《自信是人生第一桶金》的一段。见下面的链接：
              </p>
              <p>
               <a class="d4pbbc-url" href="http://www.pinggu.org/bbs/thread-863705-1-1.html" rel="nofollow" target="_blank">
                http://www.pinggu.org/bbs/thread-863705-1-1.html
               </a>
              </p>
             </div>
             <!-- .bbp-reply-content -->
            </div>
            <!-- .reply -->
            <div class="bbp-reply-header" id="post-306535">
             <div class="bbp-meta">
              <span class="bbp-reply-post-date">
               2010年7月28日 上午4:15
              </span>
              <a class="bbp-reply-permalink" href="http://cos.name/cn/topic/102130/#post-306535">
               6 楼
              </a>
              <span class="bbp-admin-links">
              </span>
             </div>
             <!-- .bbp-meta -->
            </div>
            <!-- #post-306535 -->
            <div class="even bbp-parent-forum-999 bbp-parent-topic-102130 bbp-reply-position-6 user-id-102633 topic-author post-306535 reply type-reply status-publish hentry">
             <div class="bbp-reply-author">
              <a class="bbp-author-avatar" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               <img src="http://sdn.geekzu.org/avatar/f9b2e1cc05c328fef6b12bbb5c11caa9?s=80&amp;d=monsterid&amp;r=g"/>
              </a>
              <br/>
              <a class="bbp-author-name" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               bensonwu
              </a>
              <br/>
              <div class="bbp-author-role">
               普通会员
              </div>
             </div>
             <!-- .bbp-reply-author -->
             <div class="bbp-reply-content">
              <p>
               再根据他们所用的词频看看他们三人之关系谁更近一点：
              </p>
              <p>
              </p>
              <pre class="highlight ">&gt; dist(tt_s)
..........潘石屹   任志强
任志强 243.6945
王石   161.1552 204.2890</pre>
              <p>
              </p>
             </div>
             <!-- .bbp-reply-content -->
            </div>
            <!-- .reply -->
            <div class="bbp-reply-header" id="post-306555">
             <div class="bbp-meta">
              <span class="bbp-reply-post-date">
               2010年7月29日 下午11:27
              </span>
              <a class="bbp-reply-permalink" href="http://cos.name/cn/topic/102130/#post-306555">
               7 楼
              </a>
              <span class="bbp-admin-links">
              </span>
             </div>
             <!-- .bbp-meta -->
            </div>
            <!-- #post-306555 -->
            <div class="odd bbp-parent-forum-999 bbp-parent-topic-102130 bbp-reply-position-7 user-id-102633 topic-author post-306555 reply type-reply status-publish hentry">
             <div class="bbp-reply-author">
              <a class="bbp-author-avatar" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               <img src="http://sdn.geekzu.org/avatar/f9b2e1cc05c328fef6b12bbb5c11caa9?s=80&amp;d=monsterid&amp;r=g"/>
              </a>
              <br/>
              <a class="bbp-author-name" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               bensonwu
              </a>
              <br/>
              <div class="bbp-author-role">
               普通会员
              </div>
             </div>
             <!-- .bbp-reply-author -->
             <div class="bbp-reply-content">
              <p>
               根据新浪微博的记录文字挖掘的娱乐圈关系图，关系近的人不一定认识，但性情、志趣相近，在一起一定有共同语言。
              </p>
              <p>
               <img src="http://cos.name/cn/topic/102130/&lt;/p&gt;
&lt;p&gt;"/>
              </p>
             </div>
             <!-- .bbp-reply-content -->
            </div>
            <!-- .reply -->
            <div class="bbp-reply-header" id="post-306556">
             <div class="bbp-meta">
              <span class="bbp-reply-post-date">
               2010年7月29日 下午11:37
              </span>
              <a class="bbp-reply-permalink" href="http://cos.name/cn/topic/102130/#post-306556">
               8 楼
              </a>
              <span class="bbp-admin-links">
              </span>
             </div>
             <!-- .bbp-meta -->
            </div>
            <!-- #post-306556 -->
            <div class="even bbp-parent-forum-999 bbp-parent-topic-102130 bbp-reply-position-8 user-id-102633 topic-author post-306556 reply type-reply status-publish hentry">
             <div class="bbp-reply-author">
              <a class="bbp-author-avatar" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               <img src="http://sdn.geekzu.org/avatar/f9b2e1cc05c328fef6b12bbb5c11caa9?s=80&amp;d=monsterid&amp;r=g"/>
              </a>
              <br/>
              <a class="bbp-author-name" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               bensonwu
              </a>
              <br/>
              <div class="bbp-author-role">
               普通会员
              </div>
             </div>
             <!-- .bbp-reply-author -->
             <div class="bbp-reply-content">
              <p>
               <img src="http://cos.name/cn/topic/102130/&lt;/p&gt;
&lt;p&gt;"/>
              </p>
              <p>
               [attachment=206556,417]
              </p>
             </div>
             <!-- .bbp-reply-content -->
            </div>
            <!-- .reply -->
            <div class="bbp-reply-header" id="post-306589">
             <div class="bbp-meta">
              <span class="bbp-reply-post-date">
               2010年7月30日 上午8:01
              </span>
              <a class="bbp-reply-permalink" href="http://cos.name/cn/topic/102130/#post-306589">
               9 楼
              </a>
              <span class="bbp-admin-links">
              </span>
             </div>
             <!-- .bbp-meta -->
            </div>
            <!-- #post-306589 -->
            <div class="odd bbp-parent-forum-999 bbp-parent-topic-102130 bbp-reply-position-9 user-id-102633 topic-author post-306589 reply type-reply status-publish hentry">
             <div class="bbp-reply-author">
              <a class="bbp-author-avatar" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               <img src="http://sdn.geekzu.org/avatar/f9b2e1cc05c328fef6b12bbb5c11caa9?s=80&amp;d=monsterid&amp;r=g"/>
              </a>
              <br/>
              <a class="bbp-author-name" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               bensonwu
              </a>
              <br/>
              <div class="bbp-author-role">
               普通会员
              </div>
             </div>
             <!-- .bbp-reply-author -->
             <div class="bbp-reply-content">
              <p>
               经过因子分析后重新分类：
              </p>
             </div>
             <!-- .bbp-reply-content -->
            </div>
            <!-- .reply -->
            <div class="bbp-reply-header" id="post-306600">
             <div class="bbp-meta">
              <span class="bbp-reply-post-date">
               2010年7月31日 上午1:53
              </span>
              <a class="bbp-reply-permalink" href="http://cos.name/cn/topic/102130/#post-306600">
               10 楼
              </a>
              <span class="bbp-admin-links">
              </span>
             </div>
             <!-- .bbp-meta -->
            </div>
            <!-- #post-306600 -->
            <div class="even bbp-parent-forum-999 bbp-parent-topic-102130 bbp-reply-position-10 user-id-102633 topic-author post-306600 reply type-reply status-publish hentry">
             <div class="bbp-reply-author">
              <a class="bbp-author-avatar" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               <img src="http://sdn.geekzu.org/avatar/f9b2e1cc05c328fef6b12bbb5c11caa9?s=80&amp;d=monsterid&amp;r=g"/>
              </a>
              <br/>
              <a class="bbp-author-name" href="http://cos.name/cn/profile/102633/" rel="nofollow" title="查看bensonwu的档案">
               bensonwu
              </a>
              <br/>
              <div class="bbp-author-role">
               普通会员
              </div>
             </div>
             <!-- .bbp-reply-author -->
             <div class="bbp-reply-content">
              <p>
               经过因子分析后重新分类：
              </p>
              <p>
               <img src="http://cos.name/cn/topic/102130/&lt;/p&gt;
&lt;p&gt;"/>
              </p>
              <p>
               [attachment=206600,420] [attachment=206600,421]
              </p>
             </div>
             <!-- .bbp-reply-content -->
            </div>
            <!-- .reply -->
            <div class="bbp-reply-header" id="post-309563">
             <div class="bbp-meta">
              <span class="bbp-reply-post-date">
               2010年10月13日 下午3:45
              </span>
              <a class="bbp-reply-permalink" href="http://cos.name/cn/topic/102130/#post-309563">
               11 楼
              </a>
              <span class="bbp-admin-links">
              </span>
             </div>
             <!-- .bbp-meta -->
            </div>
            <!-- #post-309563 -->
            <div class="odd bbp-parent-forum-999 bbp-parent-topic-102130 bbp-reply-position-11 user-id-13526 post-309563 reply type-reply status-publish hentry">
             <div class="bbp-reply-author">
              <a class="bbp-author-avatar" href="http://cos.name/cn/profile/13526/" rel="nofollow" title="查看cloud wei的档案">
               <img src="http://sdn.geekzu.org/avatar/c756f0debd02bd11e1c0f1d2cf0beeb5?s=80&amp;d=monsterid&amp;r=g"/>
              </a>
              <br/>
              <a class="bbp-author-name" href="http://cos.name/cn/profile/13526/" rel="nofollow" title="查看cloud wei的档案">
               cloud wei
              </a>
              <br/>
              <div class="bbp-author-role">
               版主
              </div>
             </div>
             <!-- .bbp-reply-author -->
             <div class="bbp-reply-content">
              <p>
               这么有趣的东西竟然沉底了[s:12]
              </p>
             </div>
             <!-- .bbp-reply-content -->
            </div>
            <!-- .reply -->
            <div class="bbp-reply-header" id="post-309565">
             <div class="bbp-meta">
              <span class="bbp-reply-post-date">
               2010年10月13日 下午11:56
              </span>
              <a class="bbp-reply-permalink" href="http://cos.name/cn/topic/102130/#post-309565">
               12 楼
              </a>
              <span class="bbp-admin-links">
              </span>
             </div>
             <!-- .bbp-meta -->
            </div>
            <!-- #post-309565 -->
            <div class="even bbp-parent-forum-999 bbp-parent-topic-102130 bbp-reply-position-12 user-id-54963 post-309565 reply type-reply status-publish hentry">
             <div class="bbp-reply-author">
              <a class="bbp-author-avatar" href="http://cos.name/cn/profile/54963/" rel="nofollow" title="查看fan的档案">
               <img src="http://sdn.geekzu.org/avatar/0f724dd2ae26d54dfd05ff44f61f8a84?s=80&amp;d=monsterid&amp;r=g"/>
              </a>
              <br/>
              <a class="bbp-author-name" href="http://cos.name/cn/profile/54963/" rel="nofollow" title="查看fan的档案">
               fan
              </a>
              <br/>
              <div class="bbp-author-role">
               版主
              </div>
             </div>
             <!-- .bbp-reply-author -->
             <div class="bbp-reply-content">
              <p>
               是啊，顶起来[s:19]
              </p>
             </div>
             <!-- .bbp-reply-content -->
            </div>
            <!-- .reply -->
            <div class="bbp-reply-header" id="post-309825">
             <div class="bbp-meta">
              <span class="bbp-reply-post-date">
               2010年10月21日 上午6:15
              </span>
              <a class="bbp-reply-permalink" href="http://cos.name/cn/topic/102130/#post-309825">
               13 楼
              </a>
              <span class="bbp-admin-links">
              </span>
             </div>
             <!-- .bbp-meta -->
            </div>
            <!-- #post-309825 -->
            <div class="odd bbp-parent-forum-999 bbp-parent-topic-102130 bbp-reply-position-13 user-id-4418 post-309825 reply type-reply status-publish hentry">
             <div class="bbp-reply-author">
              <a class="bbp-author-avatar" href="http://cos.name/cn/profile/4418/" rel="nofollow" title="查看sociology的档案">
               <img src="http://sdn.geekzu.org/avatar/a0974731fb1ca22ea0fb104902bce657?s=80&amp;d=monsterid&amp;r=g"/>
              </a>
              <br/>
              <a class="bbp-author-name" href="http://cos.name/cn/profile/4418/" rel="nofollow" title="查看sociology的档案">
               sociology
              </a>
              <br/>
              <div class="bbp-author-role">
               普通会员
              </div>
             </div>
             <!-- .bbp-reply-author -->
             <div class="bbp-reply-content">
              <p>
               现在中文分词软件已经直接放到RQDAtm程序包中(
               <a href="https://r-forge.r-project.org/R/?group_id=137" rel="nofollow">
                https://r-forge.r-project.org/R/?group_id=137
               </a>
               )，不需要另外安装。
              </p>
             </div>
             <!-- .bbp-reply-content -->
            </div>
            <!-- .reply -->
            <div class="bbp-reply-header" id="post-310126">
             <div class="bbp-meta">
              <span class="bbp-reply-post-date">
               2010年10月28日 上午8:05
              </span>
              <a class="bbp-reply-permalink" href="http://cos.name/cn/topic/102130/#post-310126">
               14 楼
              </a>
              <span class="bbp-admin-links">
              </span>
             </div>
             <!-- .bbp-meta -->
            </div>
            <!-- #post-310126 -->
            <div class="even bbp-parent-forum-999 bbp-parent-topic-102130 bbp-reply-position-14 user-id-336 post-310126 reply type-reply status-publish hentry">
             <div class="bbp-reply-author">
              <a class="bbp-author-avatar" href="http://cos.name/cn/profile/336/" rel="nofollow" title="查看刘思喆的档案">
               <img src="http://sdn.geekzu.org/avatar/6ca0529d22d1bf25a1e5cee3af3456f9?s=80&amp;d=monsterid&amp;r=g"/>
              </a>
              <br/>
              <a class="bbp-author-name" href="http://cos.name/cn/profile/336/" rel="nofollow" title="查看刘思喆的档案">
               刘思喆
              </a>
              <br/>
              <div class="bbp-author-role">
               版主
              </div>
             </div>
             <!-- .bbp-reply-author -->
             <div class="bbp-reply-content">
              <p>
               回复 第11楼 的 cloud_wei：这个帖子一出来我就给加了标签。不过对这方面了解的人似乎不多，慢慢就沉了[s:11]
              </p>
             </div>
             <!-- .bbp-reply-content -->
            </div>
            <!-- .reply -->
            <div class="bbp-reply-header" id="post-310226">
             <div class="bbp-meta">
              <span class="bbp-reply-post-date">
               2010年10月31日 上午6:38
              </span>
              <a class="bbp-reply-permalink" href="http://cos.name/cn/topic/102130/#post-310226">
               15 楼
              </a>
              <span class="bbp-admin-links">
              </span>
             </div>
             <!-- .bbp-meta -->
            </div>
            <!-- #post-310226 -->
            <div class="odd bbp-parent-forum-999 bbp-parent-topic-102130 bbp-reply-position-15 user-id-366025 post-310226 reply type-reply status-publish hentry">
             <div class="bbp-reply-author">
              <a class="bbp-author-avatar" href="http://cos.name/cn/profile/366025/" rel="nofollow" title="查看uunetcom的档案">
               <img src="http://sdn.geekzu.org/avatar/697b16e7554ec6a80bef8aa864bd113b?s=80&amp;d=monsterid&amp;r=g"/>
              </a>
              <br/>
              <a class="bbp-author-name" href="http://cos.name/cn/profile/366025/" rel="nofollow" title="查看uunetcom的档案">
               uunetcom
              </a>
              <br/>
              <div class="bbp-author-role">
               普通会员
              </div>
             </div>
             <!-- .bbp-reply-author -->
             <div class="bbp-reply-content">
              <p>
               分类标签多了机器慢啊
              </p>
             </div>
             <!-- .bbp-reply-content -->
            </div>
            <!-- .reply -->
           </li>
           <!-- .bbp-body -->
           <li class="bbp-footer">
            <div class="bbp-reply-author">
             作者
            </div>
            <div class="bbp-reply-content">
             帖子
            </div>
            <!-- .bbp-reply-content -->
           </li>
           <!-- .bbp-footer -->
          </ul>
          <!-- #topic-102130-replies -->
          <div class="bbp-pagination">
           <div class="bbp-pagination-count">
            查看 15 个帖子 - 1 到 15（总计 26 个）
           </div>
           <div class="bbp-pagination-links">
            <span class="page-numbers current">
             1
            </span>
            <a class="page-numbers" href="http://cos.name/cn/topic/102130/page/2/?new=1">
             2
            </a>
            <a class="next page-numbers" href="http://cos.name/cn/topic/102130/page/2/?new=1">
             →
            </a>
           </div>
          </div>
          <div class="bbp-no-reply" id="no-reply-102130">
           <div class="bbp-template-notice">
            <p>
             您必须先登录才能回复该主题。
            </p>
           </div>
          </div>
         </div>
        </div>
        <!-- .entry-content -->
        <footer class="entry-meta">
        </footer>
        <!-- .entry-meta -->
       </article>
       <!-- #post -->
       <div class="comments-area" id="comments">
       </div>
       <!-- #comments -->
      </div>
      <!-- #content -->
     </div>
     <!-- #primary -->
     <div class="sidebar-container" id="tertiary" role="complementary">
      <div class="sidebar-inner">
       <div class="widget-area">
        <aside class="widget bbp_widget_login" id="bbp_login_widget-2">
         <h3 class="widget-title">
          登录
         </h3>
         <form action="http://cos.name/cn/wp-login.php" class="bbp-login-form" method="post">
          <fieldset>
           <legend>
            登录
           </legend>
           <div class="bbp-username">
            <label for="user_login">
             用户名:
            </label>
           </div>
           <div class="bbp-password">
            <label for="user_pass">
             密码:
            </label>
           </div>
           <div class="bbp-remember-me">
            <label for="rememberme">
             记住用户名
            </label>
           </div>
           <div class="bbp-submit-wrapper">
            <button class="button submit user-submit" id="user-submit" name="user-submit" tabindex="104" type="submit">
             登录
            </button>
           </div>
           <div class="bbp-login-links">
            <a class="bbp-register-link" href="http://cos.name/cn/wp-login.php?action=register" title="注册">
             注册
            </a>
            <a class="bbp-lostpass-link" href="http://cos.name/cn/wp-login.php?action=lostpassword" title="忘记密码">
             忘记密码
            </a>
           </div>
          </fieldset>
         </form>
        </aside>
        <aside class="widget widget_text" id="text-7">
         <h3 class="widget-title">
          搜索
         </h3>
         <div class="textwidget">
          <form action="http://www.google.com/search" id="bbp-search-form" method="get" onsubmit="Gsitesearch(this)" role="search">
           <div>
           </div>
          </form>
          <form id="bbp-search-form-baidu" onsubmit="g(this)" role="search">
           <div>
           </div>
          </form>
         </div>
        </aside>
        <aside class="widget widget_text" id="text-2">
         <h3 class="widget-title">
          新鲜事
         </h3>
         <div class="textwidget">
          <ul>
           <li>
            <a href="http://cos.name/cn/topics/">
             最新帖子
            </a>
           </li>
           <li>
            <a href="http://cos.name/cn/view/popular/">
             最热门主题
            </a>
           </li>
           <li>
            <a href="http://cos.name/cn/view/no-replies/">
             消灭零回复
            </a>
           </li>
          </ul>
         </div>
        </aside>
        <aside class="widget widget_text" id="text-3">
         <h3 class="widget-title">
          RSS订阅
         </h3>
         <div class="textwidget">
          <ul>
           <li>
            <img src="http://cos.name/wp-includes/images/rss.png"/>
            <a href="http://cos.name/cn/topics/feed/">
             所有主题
            </a>
           </li>
           <li>
            <img src="http://cos.name/wp-includes/images/rss.png"/>
            <a href="http://cos.name/cn/forums/feed/">
             所有帖子
            </a>
           </li>
          </ul>
         </div>
        </aside>
       </div>
       <!-- .widget-area -->
      </div>
      <!-- .sidebar-inner -->
     </div>
     <!-- #tertiary -->
    </div>
    <!-- #main -->
    <footer class="site-footer" id="colophon" role="contentinfo">
     <div class="site-info">
      版权所有 © 2014 统计之都 | 由
      <a href="http://wordpress.org/">
       WordPress
      </a>
      构建 | 主题修改自
      <a href="http://wordpress.org/themes/twentythirteen">
       Twenty Thirteen
      </a>
     </div>
     <!-- .site-info -->
    </footer>
    <!-- #colophon -->
   </div>
   <!-- #page -->
  </div>
 </body>
</html>